بررسی اثرات خطوط تلفنی بر روی سیگنال صوتی و جبران اثرات نویز تلفنی بر سیستم بازشناسی گفتار فارسی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه علم و صنعت ایران - دانشکده مهندسی کامپیوتر
  • نویسنده سعید مرادی
  • استاد راهنما احمد اکبری
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1382
چکیده

شرایط محیطی دریافت صوت از جمله محدودیت پهنای باند در کانال انتقال استفاده از وسایل با کیفیت پایین و اثر میکروفن بعنوان نویز کانوالو شونده و همچنین اثرات جریان هوا و گفتگوهای زمینه و .... بعنوان نویز جمع شونده باعث افت آشکار در کارایی سیستم های بازشناسی گفتار می شود. هدف از روشهای مقاوم سازی در برابر نویز کم کردن عدم تطابق بین توزیع بردارهای ویژگی در تشخیص دهنده و داده ا آزمون و بالابردن کارایی سیستم بازشناسی گفتار است. روشهای مقاوم سازی را می توان در قالب دو گروه مبتنی بر داده و مبتنی بر مدل تقسیم کرد. روشهای مبتنی بر داده سیگنال گفتار یا ویژگیهای آن را اصلاح می کند و روشهای مبتنی بر مدل بدون تغییر در سیگنال یا ویژگیهای آن پارامترهای مدل را تغییر داده و اصلاح می کنند. در این پایان نامه روشهای مقاوم سازی مبتنی بر داده مورد نظر بوده و از آن میان روش تفاضل طیف و تبدیل موجک برای بهبود نویز پس زمینه سیگنال و روش تفاضل میانگین کپسترال برای جبران اثر نویز کانال مورد استفاده قرار گرفته اند. که چهار نوع الگوریتم مختلف حذف نویز در تبدیل موجک استفاده گردیده است. برای آزمایش این روشها در مورد بازشناسی در این پروژه یک پایگاه داده اختصاصی گفتار شامل اعداد یک رقمی فارسی با یکصد گوینده مختلف بصورت تلفنی و موبایل پیاده سازی و ایجاد شده است. در این پروژه با توجه یه اینکه استفاده معمولی از الگوریتم های حذف بروش تبدیل موجک بهبودی در کاربردهای بازشناسی بدست نمی دهد یک راه حل جدید برای افزایش کارایی این الگوریتم ها ارایه گردیده است. آزمایشات انجام یافته برای گوینده هایی که در آموزش شرکت داشته اند و گوینده هایی که در آموزش شرکت نداشته اند در سیگنال به نویزهای مختلف بطور جداگانه انجام گرفته و در مقایسه با روش پایه mfcc برای بازشناسی با ویژگیهای مقاوم 2 تا 6 درصد و با روش تفاضل طیف 4 الی 14 درصد بهبود مشاهده می شود. در الگوریتم های حذف نویز بروش تبدیل موجک الگوریتم rigrsure نسبت به سه الگوریتم دیگر بهتر عمل کرده ولی نسبت به روشهای قبلی بهبودی نشان نمی دهند. که یک راه حل جدید برای افزایش کارایی الگوریتم های مختلف این روش ارایه گردیده است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بازشناسی مقاوم گفتار تلفنی فارسی مبتنی بر روش سری های تیلور برداری

برای مقاوم سازی سیستم بازشناسی گفتار در برابر عوامل مزاحم محیطی (نویز جمع شونده، اثر اعوجاج کانال انتقال و نویزهای گذرا) سه ایده کلی وجود دارد: 1- استخراج وی‍ژگی های مقاوم(robust feature extraction) 2- بهبود کیفیت بردارهای بازنمایی (feature enhancement) 3- اصلاح مدل بازشناسی صوتی (acoustic model compensation) در ایده اول سعی می شود تا از ویژگی ها و پارمترهایی از سیگنال گفتار برای ساخت بر...

15 صفحه اول

ارتقاء کیفیت بازشناسی گفتار تلفنی و غیر تلفنی با استفاده از اشتراک دانش آوایی دادگان

سیستمهای بازشناسی مقاوم گفتار به سیستمهایی اطلاق می گردد که در شرایط عدم انطباق داده های آموزش و آزمون صحت بازشناسی قابل قبولی داشته باشند. در تحقیق حاضر یک سیستم بازشناسی مقاوم گفتار تلفنی، مبتنی بر اصلاح بردارهای بازنمایی توسط شبکه عصبی دوسویه (یک شبکه عصبی چند لایه معمولی به علاوه یک شاخه برگشتی که اطلاعات لایه مخفی شبکه را با ورودی شبکه ترکیب می کند) و مدلهای مخفی مارکف به عنوان مدلهای بازش...

15 صفحه اول

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

بازشناسی گوینده مستقل از متن براساس گفتار تلفنی توسط شبکه های عصبی

در این پایان نامه سیستمی به منظور بازشناسی هویت گوینده مستقل از متن براساس گفتار تلفنی و به کمک شبکه های عصبی طراحی و پیاده سازی شده است . جهت این کار از دو دادگان گفتار زبان فارسی farsdat و tfarsdat استفاده شده است .

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه علم و صنعت ایران - دانشکده مهندسی کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023